智能论文笔记

Unsupervised Domain Adaptation for Automated Knee Osteoarthritis Phenotype Classification

Junru Zhong , Yongcheng Yao , Donal G. Cahill , Fan Xiao , Siyue Li , Jack Lee , Kevin Ki-Wai Ho , Michael Tim-Yun Ong , James F. Griffith , Weitian Chen

分类：计算机视觉

2022-12-14

Purpose: The aim of this study was to demonstrate the utility of unsupervised domain adaptation (UDA) in automated knee osteoarthritis (OA) phenotype classification using a small dataset (n=50). Materials and Methods: For this retrospective study, we collected 3,166 three-dimensional (3D) double-echo steady-state magnetic resonance (MR) images from the Osteoarthritis Initiative dataset and 50 3D turbo/fast spin-echo MR images from our institute (in 2020 and 2021) as the source and target datasets, respectively. For each patient, the degree of knee OA was initially graded according to the MRI Osteoarthritis Knee Score (MOAKS) before being converted to binary OA phenotype labels. The proposed UDA pipeline included (a) pre-processing, which involved automatic segmentation and region-of-interest cropping; (b) source classifier training, which involved pre-training phenotype classifiers on the source dataset; (c) target encoder adaptation, which involved unsupervised adaption of the source encoder to the target encoder and (d) target classifier validation, which involved statistical analysis of the target classification performance evaluated by the area under the receiver operating characteristic curve (AUROC), sensitivity, specificity and accuracy. Additionally, a classifier was trained without UDA for comparison. Results: The target classifier trained with UDA achieved improved AUROC, sensitivity, specificity and accuracy for both knee OA phenotypes compared with the classifier trained without UDA. Conclusion: The proposed UDA approach improves the performance of automated knee OA phenotype classification for small target datasets by utilising a large, high-quality source dataset for training. The results successfully demonstrated the advantages of the UDA approach in classification on small datasets.

translated by 谷歌翻译

RT-1: Robotics Transformer for Real-World Control at Scale

Anthony Brohan , Noah Brown , Justice Carbajal , Yevgen Chebotar , Joseph Dabis , Chelsea Finn , Keerthana Gopalakrishnan , Karol Hausman , Alex Herzog , Jasmine Hsu

分类：机器人 | 人工智能 | 自然语言处理 | 计算机视觉 | 机器学习

2022-12-13

By transferring knowledge from large, diverse, task-agnostic datasets, modern machine learning models can solve specific downstream tasks either zero-shot or with small task-specific datasets to a high level of performance. While this capability has been demonstrated in other fields such as computer vision, natural language processing or speech recognition, it remains to be shown in robotics, where the generalization capabilities of the models are particularly critical due to the difficulty of collecting real-world robotic data. We argue that one of the keys to the success of such general robotic models lies with open-ended task-agnostic training, combined with high-capacity architectures that can absorb all of the diverse, robotic data. In this paper, we present a model class, dubbed Robotics Transformer, that exhibits promising scalable model properties. We verify our conclusions in a study of different model classes and their ability to generalize as a function of the data size, model size, and data diversity based on a large-scale data collection on real robots performing real-world tasks. The project's website and videos can be found at robotics-transformer.github.io

translated by 谷歌翻译

Diverse Title Generation for Stack Overflow Posts with Multiple Sampling Enhanced Transformer

Fengji Zhang , Jin Liu , Yao Wan , Xiao Yu , Xiao Liu , Jacky Keung

分类：自然语言处理

2022-08-24

Stack Overflow是最受欢迎的编程社区之一，开发人员可以为他们遇到的问题寻求帮助。然而，如果没有经验的开发人员无法清楚地描述他们的问题，那么他们很难吸引足够的关注并获得预期的答案。我们提出了M $ _3 $ NSCT5，这是一种自动从给定代码片段生成多个帖子标题的新颖方法。开发人员可以使用生成的标题查找密切相关的帖子并完成其问题描述。 M $ _3 $ NSCT5使用Codet5骨干，这是一种具有出色语言理解和发电能力的预训练的变压器模型。为了减轻歧义问题，即在不同背景下可以将相同的代码片段与不同的标题保持一致，我们提出了最大的边缘多元核抽样策略，以一次产生多个高质量和不同的标题候选者，以便开发人员选择。我们构建了一个大规模数据集，其中包含890,000个问题帖子，其中涵盖了八种编程语言，以验证M $ _3 $ NSCT5的有效性。 BLEU和胭脂指标的自动评估结果表明，M $ _3 $ NSCT5的优势比六个最先进的基线模型。此外，具有值得信赖结果的人类评估也证明了我们对现实世界应用方法的巨大潜力。

translated by 谷歌翻译

HTML版本

Semi-supervised Learning with Deterministic Labeling and Large Margin Projection

Ji Xu , Gang Ren , Yao Xiao , Shaobo Li , Guoyin Wang

分类：人工智能

2022-08-17

标记数据的中心性和多样性对半监督学习（SSL）的性能非常有影响，但是大多数SSL模型随机选择标记的数据。迄今为止，如何保证标记数据的中心性和多样性几乎没有得到研究的关注。已经观察到最佳的领先森林（OLF）具有揭示类别开发SSL模型的类别的差异演变的优势。我们对这项研究的关键直觉是学习一个基于OLF结构识别的少量最稳定和最不同的数据，以学习一个核的大幅度度量。提出了一个优化问题以实现这一目标。同样，对于OLF，多个局部指标学习促进了解决SSL中多模式和混合模式问题的促进。归因于这种新颖的设计，与基线方法相比，基于OLF的SSL模型的准确性和性能稳定性在没有牺牲太多效率的情况下得到了显着改善。实验研究表明，与最先进的图形SSL方法相比，提出的方法可以鼓励精度和运行时间。代码已在https://github.com/alanxuji/delala上提供。

translated by 谷歌翻译

Research: Modeling Price Elasticity for Occupancy Prediction in Hotel Dynamic Pricing

Fanwei Zhu , Wendong Xiao , Yao Yu , Ziyi Wang , Zulong Chen , Quan Lu , Zemin Liu , Minghui Wu , Shenghua Ni

分类：机器学习

2022-08-04

需求估计在动态定价中起着重要的作用，在动态定价中，可以通过基于需求曲线最大化收入来获得最佳价格。在在线酒店预订平台中，房间的需求或占用率随着房间类型而变化，随着时间的推移变化，因此获得准确的占用估算是一项挑战。在本文中，我们提出了一种新颖的酒店需求功能，该功能明确地模拟了对占用预测需求需求的价格弹性，并设计了价格弹性预测模型，以了解各种影响因素的动态价格弹性系数。我们的模型由精心设计的弹性学习模块组成，以减轻内生性问题，并在多任务框架中接受培训以解决数据稀疏性。我们在现实世界数据集上进行了全面的实验，并验证方法优于最先进的基准，以实现占用预测和动态定价。

translated by 谷歌翻译

Re-thinking and Re-labeling LIDC-IDRI for Robust Pulmonary Cancer Prediction

Hanxiao Zhang , Xiao Gu , Minghui Zhang , Weihao Yu , Liang Chen , Zhexin Wang , Feng Yao , Yun Gu , Guang-Zhong Yang

分类：计算机视觉

2022-07-28

LIDC-IDRI数据库是肺癌预测的最流行的基准。但是，通过放射科医生的主观评估，LIDC中的结节可能与病理基础真理具有完全不同的恶性注释，从而引入了标签分配错误，并在培训期间引起了后续的监督偏见。因此，LIDC数据库需要更多的客观标签来基于学习的癌症预测。基于一个额外的小数据集，该数据集包含通过病理检查诊断的180个结节，我们建议重新标记LIDC数据，以减轻对此强大基准测试的原始注释偏差的影响。我们在本文中证明，基于度量学习的类似结节检索提供新标签将是一种有效的重新标记策略。对这些重新标记的LIDC结节进行的培训可改善模型性能，当添加不确定的结节的新标签时，这将增强。我们进一步推断出，重新标记的LIDC是最终的良好肺癌预测的方便方法，同时构建大型病理预处理的结节数据库提供了长期解决方案。

translated by 谷歌翻译

Tackling Long-Tailed Category Distribution Under Domain Shifts

Xiao Gu , Yao Guo , Zeju Li , Jianing Qiu , Qi Dou , Yuxuan Liu , Benny Lo , Guang-Zhong Yang

分类：计算机视觉

2022-07-20

当1）培训数据集的类别分布P（Y）时，机器学习模型无法在现实世界应用程序上表现良好。现有方法无法处理存在两个问题的方案，但是对于现实世界应用程序来说，这很常见。在这项研究中，我们向前迈出了一步，研究了域转移下的长尾分类问题。我们设计了三个新颖的核心功能块，包括分布校准的分类损失，视觉语义映射和语义相似性引导性增强。此外，我们采用了一个元学习框架，该框架集成了这三个区块，以改善对看不见的目标域的域概括。为此问题提出了两个新的数据集，称为AWA2-LTS和Imagenet-LTS。我们在两个数据集上评估了我们的方法，并且广泛的实验结果表明，我们提出的方法可以比最新的长尾/域概括方法和组合实现优越的性能。源代码和数据集可以在我们的项目页面https://xiaogu.site/ltds上找到。

translated by 谷歌翻译

Contributions of Shape, Texture, and Color in Visual Recognition

Yunhao Ge , Yao Xiao , Zhi Xu , Xingrui Wang , Laurent Itti

分类：计算机视觉

2022-07-19

我们研究了人类视觉系统（HVS）〜-〜形状，纹理和颜色〜-〜对对象分类的三个重要特征的贡献。我们构建了人形视觉引擎（HVE），该引擎明确和单独计算图像中的形状，纹理和颜色特征。然后将所得的特征向量连接以支持最终分类。我们表明，HVE可以总结和排序排序对对象识别的三个功能的贡献。我们使用人类实验来确认HVE和人类主要使用一些特定特征来支持特定类别的分类（例如，纹理是将斑马与其他四足动物区分开的主要特征，包括人类和HVE）。借助HVE的帮助，给定任何环境（数据集），我们可以总结整个任务的最重要功能（特定于任务的; （特定于类；为了证明HVE的更有用，我们使用它来模拟没有属性标签的人类的开放世界零射击学习能力。最后，我们表明HVE还可以通过不同特征的组合来模拟人类的想象力。我们将开源HVE引擎和相应的数据集。

translated by 谷歌翻译

DESCN: Deep Entire Space Cross Networks for Individual Treatment Effect Estimation

Kailiang Zhong , Fengtong Xiao , Yan Ren , Yaorong Liang , Wenqing Yao , Xiaofeng Yang , Ling Cen

分类：机器学习 | 人工智能

2022-07-19

因果推论在电子商务和精确医学等各个领域都有广泛的应用，其性能在很大程度上取决于对个体治疗效果（ITE）的准确估计。通常，通过在其各个样品空间中分别对处理和控制响应函数进行建模来预测ITE。但是，这种方法通常会在实践中遇到两个问题，即治疗偏见引起的治疗组和对照组之间的分布分布以及其人口规模的显着样本失衡。本文提出了深层的整个空间跨网络（DESCN），以从端到端的角度进行建模治疗效果。 DESCN通过多任务学习方式捕获了治疗倾向，反应和隐藏治疗效果的综合信息。我们的方法共同学习了整个样品空间中的治疗和反应功能，以避免治疗偏见，并采用中间伪治疗效应预测网络来减轻样品失衡。从电子商务凭证分销业务的合成数据集和大规模生产数据集进行了广泛的实验。结果表明，DESCN可以成功提高ITE估计的准确性并提高提升排名的性能。发布生产数据集和源代码的样本是为了促进社区的未来研究，据我们所知，这是首个大型公共偏见的因果推理数据集。

translated by 谷歌翻译

Task-agnostic Defense against Adversarial Patch Attacks

Ke Xu , Yao Xiao , Zhaoheng Zheng , Kaijie Cai , Ram Nevatia

分类：计算机视觉 | 机器学习

2022-07-05

对抗斑块攻击通过在指定的局部区域中注入对抗像素来误导神经网络。补丁攻击可以在各种任务中非常有效，并且可以通过附件（例如贴纸）在现实世界对象上实现。尽管攻击模式的多样性，但对抗斑块往往具有高质感，并且外观与自然图像不同。我们利用此属性，并在patchzero上进行patchzero，这是一种针对白色框对面补丁的任务不合时宜的防御。具体而言，我们的防御通过用平均像素值重新粉刷来检测对抗性像素和“零”斑块区域。我们将补丁检测问题作为语义分割任务提出，以便我们的模型可以推广到任何大小和形状的贴片。我们进一步设计了一个两阶段的对抗训练计划，以防止更强烈的适应性攻击。我们在图像分类（ImageNet，resisc45），对象检测（Pascal VOC）和视频分类（UCF101）数据集上彻底评估PatchZero。我们的方法可实现SOTA的稳健精度，而不会在良性表现中降解。

translated by 谷歌翻译